智能论文笔记

SImProv: Scalable Image Provenance Framework for Robust Content Attribution

Alexander Black , Tu Bui , Simon Jenni , Zhifei Zhang , Viswanathan Swaminanthan , John Collomosse

分类：计算机视觉

2022-06-28

我们提出Simprov-可扩展的图像出处框架，将查询图像匹配回到可信的原始数据库，并在查询上确定可能的操作。 Simprov由三个阶段组成：检索Top-K最相似图像的可扩展搜索阶段；一个重新排列和近乎解复的检测阶段，用于识别候选人之间的原件；最后，在查询中定位区域的操纵检测和可视化阶段可能被操纵与原始区域不同。 Simprov对在线再分配过程中通常发生的良性图像转换非常强大，例如由于噪声和重新压缩降解而引起的工件，以及由于图像填充，翘曲，尺寸和形状的变化而引起的过度转换。通过对比较器体系结构中可区分的翘曲模块的端到端训练，可以实现对实地转换的鲁棒性。我们证明了对1亿张图像的数据集的有效检索和操纵检测。

translated by 谷歌翻译

Privacy Aware Experiments without Cookies

Shiv Shankar , Ritwik Sinha , Saayan Mitra , Moumita Sinha , Viswanathan Swaminathan , Sridhar Mahadevan

分类：人工智能

2022-11-03

Consider two brands that want to jointly test alternate web experiences for their customers with an A/B test. Such collaborative tests are today enabled using \textit{third-party cookies}, where each brand has information on the identity of visitors to another website. With the imminent elimination of third-party cookies, such A/B tests will become untenable. We propose a two-stage experimental design, where the two brands only need to agree on high-level aggregate parameters of the experiment to test the alternate experiences. Our design respects the privacy of customers. We propose an estimater of the Average Treatment Effect (ATE), show that it is unbiased and theoretically compute its variance. Our demonstration describes how a marketer for a brand can design such an experiment and analyze the results. On real and simulated data, we show that the approach provides valid estimate of the ATE with low variance and is robust to the proportion of visitors overlapping across the brands.

translated by 谷歌翻译

Differentiable physics-enabled closure modeling for Burgers' turbulence

Varun Shankar , Vedant Puri , Ramesh Balakrishnan , Romit Maulik , Venkatasubramanian Viswanathan

分类：机器学习

2022-09-23

数据驱动的湍流建模正在经历数据科学算法和硬件开发后的兴趣激增。我们讨论了一种使用可区分物理范式的方法，该方法将已知的物理学与机器学习结合起来，以开发汉堡湍流的闭合模型。我们将1D汉堡系统视为一种原型测试问题，用于建模以对流为主的湍流问题中未解决的术语。我们训练一系列模型，这些模型在后验损失函数上结合了不同程度的物理假设，以测试模型在一系列系统参数（包括粘度，时间和网格分辨率）上的疗效。我们发现，以部分微分方程形式的归纳偏差的约束模型包含已知物理或现有闭合方法会产生高度数据效率，准确和可推广的模型，并且表现优于最先进的基准。以物理信息形式添加结构还为模型带来了一定程度的解释性，可能为封闭建模的未来提供了垫脚石。

translated by 谷歌翻译

Predictive Scale-Bridging Simulations through Active Learning

Satish Karra , Mohamed Mehana , Nicholas Lubbers , Yu Chen , Abdourahmane Diaw , Javier E. Santos , Aleksandra Pachalieva , Robert S. Pavel , Jeffrey R. Haack , Michael McKerns

分类：机器学习 | 人工智能 | (统计)机器学习

2022-09-20

在整个计算科学中，越来越需要利用原始计算马力的持续改进，通过对蛮力的尺度锻炼的尺度增加，以增加网状元素数量的增加。例如，如果不考虑分子水平的相互作用，就不可能对纳米多孔介质的转运进行定量预测，即从紧密的页岩地层提取至关重要的碳氢化合物。同样，惯性限制融合模拟依赖于数值扩散来模拟分子效应，例如非本地转运和混合，而无需真正考虑分子相互作用。考虑到这两个不同的应用程序，我们开发了一种新颖的功能，该功能使用主动学习方法来优化局部细尺度模拟的使用来告知粗尺度流体动力学。我们的方法解决了三个挑战：预测连续性粗尺度轨迹，以推测执行新的精细分子动力学计算，动态地更新细度计算中的粗尺度，并量化神经网络模型中的不确定性。

translated by 谷歌翻译

TagRec++: Hierarchical Label Aware Attention Network for Question Categorization

Venktesh Viswanathan , Mukesh Mohania , Vikram Goyal

分类：自然语言处理

2022-08-10

在线学习系统具有成绩单，书籍和问题形式的多个数据存储库。为了易于访问，此类系统会根据层次性质（主题 - 主题）的明确分类法组织内容。将输入分类为层次标签的任务通常被视为平坦的多类分类问题。这种方法忽略了输入中的术语与层次标签中的令牌之间的语义相关性。当它们仅将叶片节点视为标签时，替代方法也患有类不平衡。为了解决这些问题，我们将任务制定为一个密集的检索问题，以检索每个内容的适当层次标签。在本文中，我们处理问题。我们将层次标签建模为其令牌的组成，并使用有效的交叉注意机制将信息与内容术语表示融合。我们还提出了一种自适应内部的硬采样方法，随着培训的进行，该方法可以更好地取消负面影响。我们证明了所提出的方法\ textit {tagrec ++}在问题数据集上的现有最新方法均超过了receal@k所测量的现有最新方法。此外，我们演示了\ textit {tagrec ++}的零射击功能以及适应标签更改的能力。

translated by 谷歌翻译

Video Manipulations Beyond Faces: A Dataset with Human-Machine Analysis

Trisha Mittal , Ritwik Sinha , Viswanathan Swaminathan , John Collomosse , Dinesh Manocha

分类：计算机视觉 | 人工智能

2022-07-26

作为内容编辑成熟的工具，以及基于人工智能（AI）综合媒体增长的算法，在线媒体上的操纵内容的存在正在增加。这种现象导致错误信息的传播，从而更需要区分“真实”和“操纵”内容。为此，我们介绍了Videosham，该数据集由826个视频（413个真实和413个操纵）组成。许多现有的DeepFake数据集专注于两种类型的面部操作 - 与另一个受试者的面部交换或更改现有面部。另一方面，Videosham包含更多样化的，上下文丰富的和以人为本的高分辨率视频，使用6种不同的空间和时间攻击组合来操纵。我们的分析表明，最新的操纵检测算法仅适用于一些特定的攻击，并且在Videosham上不能很好地扩展。我们在亚马逊机械土耳其人上进行了一项用户研究，其中1200名参与者可以区分Videosham中的真实视频和操纵视频。最后，我们更深入地研究了人类和sota-Algorithms表演的优势和劣势，以识别需要用更好的AI算法填补的差距。

translated by 谷歌翻译

Show Me What I Like: Detecting User-Specific Video Highlights Using Content-Based Multi-Head Attention

Uttaran Bhattacharya , Gang Wu , Stefano Petrangeli , Viswanathan Swaminathan , Dinesh Manocha

分类：计算机视觉

2022-07-18

我们提出了一种方法，可以根据他们观看过的先前视频中标记的其首选亮点剪辑来检测给定目标视频中用户的个性重点。我们的方法明确利用对象和人类活动的预训练功能来利用首选剪辑和目标视频的内容。我们设计了一种多头注意机制，可以根据其基于对象和人类活性的内容适应优选的剪辑，并将这些权重融合为每个用户的单个特征表示。我们计算这些每个用户功能表示形式与从所需目标视频计算的每个框架功能之间的相似性，以估算目标视频中用户特定的高光剪辑。我们在包含单个用户带注释的重点的大规模检测数据集上测试我们的方法。与当前的基线相比，我们观察到在检测到的高光的平均平均精度中的绝对改善2-4％。我们还对与每个用户以及基于对象和人类活动的功能表示相关的首选突出显示剪辑的数量进行了广泛的消融实验，以验证我们的方法确实是基于内容的和特定于用户的。

translated by 谷歌翻译

Physics-informed machine learning with differentiable programming for heterogeneous underground reservoir pressure management

Aleksandra Pachalieva , Daniel O'Malley , Dylan Robert Harp , Hari Viswanathan

分类：机器学习

2022-06-21

避免地下储层中的过度压力对于诸如二氧化碳和废水注射等应用至关重要。通过控制注入/提取来管理压力，由于地下的复杂异质性。异质性通常需要高保真物理模型来对Co $ _2 $命运做出预测。此外，精确表征异质性的情况会充满参数不确定性。考虑到异质性和不确定性，这都使这是对当前储层模拟器的计算密集型问题。为了解决这个问题，我们使用全物理模型和机器学习的可区分编程来确定防止关键储层位置过度压力的流体提取率。我们使用DPFEHM框架，该框架具有基于标准的两点通量有限量离散化的值得信赖的物理学，并且像机器学习模型一样自动差异化。我们的物理知识的机器学习框架使用卷积神经网络根据渗透率领域学习适当的提取率。我们还执行超参数搜索以提高模型的准确性。执行培训和测试方案，以评估使用物理知识的机器学习来管理储层压力的可行性。我们构建并测试了一个足够精确的模拟器，该模拟器的速度比基于物理的模拟器快400000倍，从而允许接近实时分析和鲁棒的不确定性量化。

translated by 谷歌翻译

Yankee Swap: a Fast and Simple Fair Allocation Mechanism for Matroid Rank Valuations

Vignesh Viswanathan , Yair Zick

分类：人工智能

2022-06-17

当代理具有矩阵排名估值时，我们研究不可分割的商品的公平分配。我们的主要贡献是一种基于口语洋基交换程序的简单算法，该程序计算出可证明公平有效的洛伦兹（Lorenz）主导分配。尽管存在多项式时间算法来计算此类分配，但我们提出的方法以两种方式对它们进行了改进。（a）我们的方法易于理解，并且不使用复杂的Matroid优化算法作为子例程。（b）我们的方法是可扩展的；事实证明，计算洛伦兹主导分配的所有已知算法要快。这两个属性是在任何真正的公平分配设置中采用算法的关键。我们的贡献使我们更接近这个目标。

translated by 谷歌翻译

Rotation Equivariant Operators for Machine Learning on Scalar and Vector Fields

Paul Shen , Michael Herbst , Venkat Viswanathan

分类：机器学习

2021-08-21

我们开发了在标量和向量字段上旋转旋转模拟运算符的理论和软件，并在模拟，优化和机器学习中采用了不同的应用。旋转模棱两可（协方差）是指系统中的所有字段旋转在一起，这意味着保持对称性的空间不变动力学。扩展线性时间不变系统的卷积定理，我们认为线性模棱两可的操作员的特征是使用张量场卷积，使用输入场和径向对称内核字段之间的适当产物。实际上，大多数Green的功能和差分运算符都是均衡运算符，它也可以通过参数化径向函数来拟合未知的对称性保存动力学。我们在2D/3D的标量，矢量和高阶张量字段上实现了朱莉娅软件包epariantoperators.jl，以在标量，矢量和高阶张量字段上实现完全可区分的有限差量算子。它可以向前进行仿真或图像处理，或者以计算机视觉，逆问题和最佳控制而回落。 https://aced-differentiate.github.io/equivariantoperators.jl/上的代码

translated by 谷歌翻译